智能论文笔记

我们介绍了一个机器人组装系统，该系统简化了从产品组件的CAD模型到完整编程和自适应组装过程的设计对制造工作流程。我们的系统（在CAD工具中）捕获了特定机器人工作电脑组装过程的意图，并生成了任务级指令的配方。通过将视觉传感与深度学习的感知模型相结合，机器人推断出从生成的配方中组装设计的必要动作。感知模型是直接从模拟训练的，从而使系统可以根据CAD信息识别各个部分。我们用两个机器人的工作栏演示了系统，以组装互锁的3D零件设计。我们首先在模拟中构建和调整组装过程，并验证生成的食谱。最后，真正的机器人工作电池使用相同的行为组装了设计。

translated by 谷歌翻译

This paper proposes a novel model-based policy gradient algorithm for tracking dynamic targets using a mobile robot, equipped with an onboard sensor with limited field of view. The task is to obtain a continuous control policy for the mobile robot to collect sensor measurements that reduce uncertainty in the target states, measured by the target distribution entropy. We design a neural network control policy with the robot $SE(3)$ pose and the mean vector and information matrix of the joint target distribution as inputs and attention layers to handle variable numbers of targets. We also derive the gradient of the target entropy with respect to the network parameters explicitly, allowing efficient model-based policy gradient optimization.

translated by 谷歌翻译

本文提出了一种使用信息理论成本来学习有效地标本地化和探索的连续控制政策的方法。我们考虑一个移动机器人在有限的传感范围内检测地标，并解决学习控制政策的问题，该控制政策最大程度地提高了地标状态与传感器观察之间的相互信息。我们采用Kalman过滤器将地标州的部分可观察到的问题转换为马尔可夫决策过程（MDP），这是一个可区分的视野来塑造奖励，以及基于注意力的神经网络来代表控制策略。除了具有里程碑意义的定位外，该方法通过主动容积映射进一步统一，以促进勘探。与基准方法相比，在几个模拟地标本地化任务中证明了该性能。

translated by 谷歌翻译

Privacy Amplification by Subsampling in Time Domain

Tatsuki Koga , Casey Meehan , Kamalika Chaudhuri

分类：人工智能 | 机器学习

2022-01-13

聚合时序数据，如流量流和站点占用，在跨时占据人口中的统计数据。这些数据可以对理解给定人群的趋势来说可能是深切的，但也构成了重大隐私风险，可能揭示了谁在哪里才能在哪里。产生满足差分隐私（DP）的标准定义的数据系列的私有版本是由于单个参与者可以在序列上具有大量的挑战：如果个体可以贡献到每次步骤，则添加剂噪声量需要满足隐私，随着采样的时间次数，线性增加。因此，如果信号跨越持续时间长或过采样，则必须添加过多的噪声，淹没潜在的趋势。但是，在许多应用中，个人实际上无法参加每次步骤。当这种情况是这种情况时，我们观察到，可以通过回顾和/或过滤时间来减少单个参与者（灵敏度）的影响，同时仍会满足隐私要求。使用小说分析，我们表现出敏感性的显着降低，并提出了相应的隐私机制。我们用现实世界和合成时间序列数据展示了这些技术的实用益处。

translated by 谷歌翻译